02. 编码器和解码器

序列到序列模型

在学习注意力模型之前,我们总结下序列到序列模型知识。我们知道 RNN 擅长于使用和生成序列数据,并且序列到序列模型可以用于各种应用中!

序列到序列应用

编码器解码器架构

编码器和解码器

编码器和解码器并非必须是 RNN,也可以是 CNN!

在上面的示例中,我们使用 LSTM 生成单词序列;LSTM 通过跟踪看到的输入单词和自己的隐藏状态“记住”事物。

在计算机视觉中,我们可以利用这种编码器-解码器模型为输入图像生成字词或说明,甚至根据输入单词序列生成图像。我们将重点讲解第一种情形:为图像生成说明,你将在下节课深入学习如何生成说明。暂时先记住,我们可以向 CNN(编码器)中输入图像,并使用 LSTM(解码器)为该图像生成描述性说明。